Nous avons réparti le travail au sein du groupe en fonction des intérêts et des compétences de chacun. Nous avons donc eu la répartition des tâches suivante :
Massi : Utilisation de R/Python pour le traitement des données pour la partie revenus fiscaux par département + réalisation du modèle ridge
Thomas : Utilisation de RMarkdown pour présenter les données au format HTML, réalisation du rapport
Houssem : Traitement des données pour la partie démographique
Alick : Utilisation de R/Python pour le traitement des données d’hospitalisation et de réanimation et faire les graphiques et du modèle de régression linéaire
Marjorie : Traitement des données pour la partie nombre d’habitants par département + rapport RMarkdown
Ensemble des membres : Récupération des sources de données externes
Sujet 2 : Modèles de régression et sélection de variables : Existe-t-il un lien entre des facteurs climatiques (température, pluviométrie, ensoleillement, vent,… ) et socio-économiques (revenu fiscal, age, …) et l’évolution du nombre d’hospitalisations (ou réanimations) à l’échelle du département?
Ce rapport contient les résultats d’analyse de données d’hospitalisation et réanimation de la crise du covid sur le plan national et départemental.
Pour entrer dans le vif du sujet, voici un graphique dynamique représentant le nombre de réanimation pour chaque département.
L’objectif est de trouver s’il y a des liens entre ces variables et le nombre d’hospitalisation/réanimation dans le but de pouvoir par la suite prédire l’évolution ces deux nombres.
Pour cela nous avons d’abord étudié les corrélations de chaque variables avec les variables nombre d’hospitalisés et nombre de réanimation.
## hosp_pop rea_pop taux_pauvrete_moy
## hosp_pop 1.00000000 0.90642397 0.07012067
## rea_pop 0.90642397 1.00000000 0.06305053
## taux_pauvrete_moy 0.07012067 0.06305053 1.00000000
## hosp_pop rea_pop med_revenu
## hosp_pop 1.0000000 0.9064240 0.4432539
## rea_pop 0.9064240 1.0000000 0.5354672
## med_revenu 0.4432539 0.5354672 1.0000000
## hosp_pop rea_pop pourcentage_menage_imposes
## hosp_pop 1.0000000 0.9064240 0.5469651
## rea_pop 0.9064240 1.0000000 0.6080154
## pourcentage_menage_imposes 0.5469651 0.6080154 1.0000000
## hosp_pop rea_pop frequence_obesite
## hosp_pop 1.00000000 0.90642397 0.04067622
## rea_pop 0.90642397 1.00000000 -0.05313625
## frequence_obesite 0.04067622 -0.05313625 1.00000000
## hosp_pop rea_pop agriculteurs
## hosp_pop 1.0000000 0.9064240 -0.4373294
## rea_pop 0.9064240 1.0000000 -0.4678343
## agriculteurs -0.4373294 -0.4678343 1.0000000
## hosp_pop rea_pop artisans
## hosp_pop 1.0000000 0.9064240 -0.5527561
## rea_pop 0.9064240 1.0000000 -0.5316584
## artisans -0.5527561 -0.5316584 1.0000000
## hosp_pop rea_pop cadres
## hosp_pop 1.0000000 0.9064240 0.5380131
## rea_pop 0.9064240 1.0000000 0.6706368
## cadres 0.5380131 0.6706368 1.0000000
## hosp_pop rea_pop prof_ind
## hosp_pop 1.0000000 0.9064240 0.1494916
## rea_pop 0.9064240 1.0000000 0.2183703
## prof_ind 0.1494916 0.2183703 1.0000000
## hosp_pop rea_pop employes
## hosp_pop 1.0000000 0.9064240 -0.3260549
## rea_pop 0.9064240 1.0000000 -0.4134684
## employes -0.3260549 -0.4134684 1.0000000
## hosp_pop rea_pop ouvriers
## hosp_pop 1.0000000 0.9064240 -0.2531782
## rea_pop 0.9064240 1.0000000 -0.3956963
## ouvriers -0.2531782 -0.3956963 1.0000000
## hosp_pop rea_pop autres
## hosp_pop 1.0000000 0.9064240 0.3292375
## rea_pop 0.9064240 1.0000000 0.3253975
## autres 0.3292375 0.3253975 1.0000000
## hosp_pop rea_pop tmoy.avril-2020
## hosp_pop 1.00000000 0.90642397 0.01714096
## rea_pop 0.90642397 1.00000000 0.07733877
## tmoy.avril-2020 0.01714096 0.07733877 1.00000000
## hosp_pop rea_pop tmoy.mars-2020
## hosp_pop 1.0000000 0.9064240 -0.3307346
## rea_pop 0.9064240 1.0000000 -0.2759859
## tmoy.mars-2020 -0.3307346 -0.2759859 1.0000000
Nous pouvons remarquer que les corrélations entre les variables nombres à l’hôpital et en réanimation avec les variables taux de pauvreté moyen, taux d’obésité, températures moyennes au mois d’avril ne sont pas bonnes (corrélations très faibles).
Nous trouvons des variables qui semblent plutôt être corrélées avec le nombre de personnes hospitalisées et en réanimation :
Les personnes ayant une catégorie socio professionnelle de profession intermédiaire
Les personnes ayant une catégorie socio professionnelle d’employés et d’ouvriers, la corrélation est d’ailleurs négative
La variable sur les températures moyennes de mars semble aussi être corrélée négativement
Les variables qui semblent être correctement corrélées avec le nombre de personnes hospitalisées et en réanimation sont:
Le revenu médian, le pourcentage des ménages imposés et les personnes appartenant à la catégorie socio professionnelles ‘Cadres et profession intellectuelle supérieure’
Certaines variables sont corrélées négativement : les personnes appartenant à la catégorie socio professionnelles Agriculteurs, Artisans
Afin de confirmer (ou non) les corrélations trouvées nous allons maintenant faire une régression linéaire du nombre d’hospitalisés au pic de cas du premier confinement à savoir le 15/04/2020 sur l’ensemble des variables étudiées. Notre but est de savoir quelles variables a un impact sur le taux d’hospitalisation.
##
## Call:
## lm(formula = data_for_regression$hosp_pop ~ ., data = data_for_regression)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.093405 -0.025448 0.000082 0.022601 0.106951
##
## Coefficients: (1 not defined because of singularities)
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.173e-16 5.579e-03 0.000 1.000000
## rea_pop 3.195e-01 1.004e-01 3.184 0.002669 **
## nbr_pop 3.119e-02 1.671e-02 1.867 0.068588 .
## pourcentage_10_19ans 5.704e-02 4.059e-02 1.405 0.166958
## pourcentage_20_39ans 1.630e-02 4.967e-02 0.328 0.744390
## pourcentage_40_59ans -2.962e-02 1.420e-02 -2.086 0.042800 *
## pourcentage_60_74ans 4.449e-02 6.951e-02 0.640 0.525403
## pourcentage_75_etplus NA NA NA NA
## taux_pauvrete_moy -3.014e-01 3.131e-01 -0.963 0.341044
## taux_pauvrete_30etmoins 5.232e-02 4.976e-02 1.052 0.298759
## taux_pauvrete_30_39ans 9.143e-02 6.949e-02 1.316 0.195108
## taux_pauvrete_40_49ans -8.744e-02 1.249e-01 -0.700 0.487567
## taux_pauvrete_50_59ans 8.270e-02 7.369e-02 1.122 0.267840
## taux_pauvrete_60_74ans 1.859e-01 8.689e-02 2.140 0.037940 *
## taux_pauvrete_75etplus 3.960e-02 4.196e-02 0.944 0.350467
## med_revenu 4.993e-02 4.275e-02 1.168 0.249041
## pourcentage_menage_imposes -2.632e-02 3.317e-02 -0.794 0.431728
## frequence_obesite 1.887e-02 1.210e-02 1.559 0.126214
## agriculteurs 8.871e-02 2.274e-01 0.390 0.698378
## artisans 9.386e-02 1.939e-01 0.484 0.630759
## cadres 2.864e-01 7.443e-01 0.385 0.702247
## prof_ind 1.322e-01 2.332e-01 0.567 0.573725
## employes 1.577e-01 3.057e-01 0.516 0.608436
## ouvriers 2.690e-01 5.990e-01 0.449 0.655544
## autres 1.511e-03 6.185e-02 0.024 0.980622
## `tmoy.avril-2020` 3.483e-02 1.589e-02 2.192 0.033734 *
## `tmoy.mars-2020` -5.005e-02 2.313e-02 -2.164 0.035909 *
## `hosp_pop.2020-04-02` 2.277e-02 1.669e-01 0.136 0.892110
## `hosp_pop.2020-04-03` 5.678e-02 2.432e-01 0.233 0.816490
## `hosp_pop.2020-04-04` -1.587e-01 2.380e-01 -0.667 0.508359
## `hosp_pop.2020-04-05` 3.888e-01 2.686e-01 1.447 0.154881
## `hosp_pop.2020-04-06` -1.617e-01 1.959e-01 -0.825 0.413669
## `hosp_pop.2020-04-07` -4.310e-01 2.178e-01 -1.979 0.054080 .
## `hosp_pop.2020-04-08` 6.833e-02 2.257e-01 0.303 0.763535
## `hosp_pop.2020-04-09` 1.746e-01 2.306e-01 0.757 0.453100
## `hosp_pop.2020-04-10` 3.510e-01 2.334e-01 1.504 0.139710
## `hosp_pop.2020-04-11` -2.063e-02 3.033e-01 -0.068 0.946073
## `hosp_pop.2020-04-12` -1.330e-01 4.165e-01 -0.319 0.751015
## `hosp_pop.2020-04-13` 5.928e-02 4.190e-01 0.141 0.888142
## `hosp_pop.2020-04-14` 8.413e-01 2.380e-01 3.535 0.000974 ***
## `rea_pop.2020-04-02` -4.417e-02 1.223e-01 -0.361 0.719741
## `rea_pop.2020-04-03` 5.344e-02 1.653e-01 0.323 0.748090
## `rea_pop.2020-04-04` 1.898e-01 1.650e-01 1.150 0.256229
## `rea_pop.2020-04-05` -2.619e-01 1.613e-01 -1.624 0.111619
## `rea_pop.2020-04-06` -3.401e-02 1.795e-01 -0.189 0.850618
## `rea_pop.2020-04-07` -4.980e-02 1.605e-01 -0.310 0.757867
## `rea_pop.2020-04-08` 2.251e-01 1.805e-01 1.247 0.218833
## `rea_pop.2020-04-09` -2.031e-01 1.800e-01 -1.128 0.265256
## `rea_pop.2020-04-10` 5.492e-02 1.156e-01 0.475 0.637231
## `rea_pop.2020-04-11` 1.037e-01 1.941e-01 0.534 0.595874
## `rea_pop.2020-04-12` 2.094e-01 2.495e-01 0.839 0.405957
## `rea_pop.2020-04-13` -4.772e-01 2.888e-01 -1.652 0.105586
## `rea_pop.2020-04-14` -1.368e-01 1.675e-01 -0.817 0.418457
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.05466 on 44 degrees of freedom
## Multiple R-squared: 0.9986, Adjusted R-squared: 0.997
## F-statistic: 622.6 on 51 and 44 DF, p-value: < 2.2e-16
Nous remarquons tout d’abord que le modele est bon. En effet, la valeur du R-squared nous indique que les variables choisies expliquent bien le nombre d’hospitalisations du 15/04/2020.
De plus, la variable nombre en réanimation et la variable nombre d’hospitalisation du 14/04/2020 ont des coefficients très inférieures à 0.05, on peut donc faciltement en déduire qu’elles ont un impact importants sur notre nombre d’hospitalisations du pic (ce qui est cohérent).
Nous ajoutons à cela des valeurs plutot accceptables pour les variables : pourcentage des 40 à 59 ans, taux de pauvrete des 60 à 74 ans, les températures moyennes du mois précédent et du mois en cours.
Nous utilisons un stepAIC qui va tester toutes les combinaisons de variables afin de sélectionner le meilleur modèle. On testera les résultats ensuite.
##
## Call:
## lm(formula = data_for_regression$hosp_pop ~ rea_pop + nbr_pop +
## pourcentage_10_19ans + pourcentage_40_59ans + taux_pauvrete_moy +
## taux_pauvrete_30etmoins + taux_pauvrete_30_39ans + taux_pauvrete_50_59ans +
## taux_pauvrete_60_74ans + taux_pauvrete_75etplus + frequence_obesite +
## artisans + prof_ind + employes + ouvriers + `tmoy.avril-2020` +
## `tmoy.mars-2020` + `hosp_pop.2020-04-05` + `hosp_pop.2020-04-07` +
## `hosp_pop.2020-04-09` + `hosp_pop.2020-04-10` + `hosp_pop.2020-04-14` +
## `rea_pop.2020-04-04` + `rea_pop.2020-04-05` + `rea_pop.2020-04-12` +
## `rea_pop.2020-04-13` + `hosp_pop.2020-04-06`, data = data_for_regression)
##
## Coefficients:
## (Intercept) rea_pop nbr_pop
## 7.309e-17 2.523e-01 3.496e-02
## pourcentage_10_19ans pourcentage_40_59ans taux_pauvrete_moy
## 3.785e-02 -2.845e-02 -6.224e-01
## taux_pauvrete_30etmoins taux_pauvrete_30_39ans taux_pauvrete_50_59ans
## 8.565e-02 1.334e-01 1.373e-01
## taux_pauvrete_60_74ans taux_pauvrete_75etplus frequence_obesite
## 2.618e-01 6.262e-02 1.897e-02
## artisans prof_ind employes
## 2.268e-02 4.491e-02 3.182e-02
## ouvriers `tmoy.avril-2020` `tmoy.mars-2020`
## 3.955e-02 3.270e-02 -5.635e-02
## `hosp_pop.2020-04-05` `hosp_pop.2020-04-07` `hosp_pop.2020-04-09`
## 3.769e-01 -4.425e-01 1.744e-01
## `hosp_pop.2020-04-10` `hosp_pop.2020-04-14` `rea_pop.2020-04-04`
## 3.439e-01 7.713e-01 2.101e-01
## `rea_pop.2020-04-05` `rea_pop.2020-04-12` `rea_pop.2020-04-13`
## -2.969e-01 2.866e-01 -4.976e-01
## `hosp_pop.2020-04-06`
## -1.713e-01
##
## Call:
## lm(formula = data_for_regression$hosp_pop ~ rea_pop + nbr_pop +
## pourcentage_10_19ans + pourcentage_40_59ans + taux_pauvrete_moy +
## taux_pauvrete_30etmoins + taux_pauvrete_30_39ans + taux_pauvrete_50_59ans +
## taux_pauvrete_60_74ans + taux_pauvrete_75etplus + frequence_obesite +
## artisans + prof_ind + employes + ouvriers + `tmoy.avril-2020` +
## `tmoy.mars-2020` + `hosp_pop.2020-04-05` + `hosp_pop.2020-04-07` +
## `hosp_pop.2020-04-09` + `hosp_pop.2020-04-10` + `hosp_pop.2020-04-14` +
## `rea_pop.2020-04-04` + `rea_pop.2020-04-05` + `rea_pop.2020-04-12` +
## `rea_pop.2020-04-13` + `hosp_pop.2020-04-06`, data = data_for_regression)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.117606 -0.025681 -0.004418 0.031916 0.101563
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 7.309e-17 4.834e-03 0.000 1.000000
## rea_pop 2.523e-01 5.338e-02 4.726 1.19e-05 ***
## nbr_pop 3.496e-02 1.045e-02 3.345 0.001342 **
## pourcentage_10_19ans 3.785e-02 1.491e-02 2.539 0.013415 *
## pourcentage_40_59ans -2.845e-02 8.284e-03 -3.434 0.001017 **
## taux_pauvrete_moy -6.224e-01 1.160e-01 -5.368 1.04e-06 ***
## taux_pauvrete_30etmoins 8.565e-02 2.122e-02 4.036 0.000140 ***
## taux_pauvrete_30_39ans 1.334e-01 4.469e-02 2.986 0.003928 **
## taux_pauvrete_50_59ans 1.373e-01 4.643e-02 2.957 0.004268 **
## taux_pauvrete_60_74ans 2.618e-01 4.050e-02 6.464 1.29e-08 ***
## taux_pauvrete_75etplus 6.262e-02 2.081e-02 3.008 0.003681 **
## frequence_obesite 1.897e-02 8.127e-03 2.334 0.022544 *
## artisans 2.268e-02 1.463e-02 1.551 0.125624
## prof_ind 4.491e-02 1.300e-02 3.456 0.000951 ***
## employes 3.182e-02 8.888e-03 3.580 0.000640 ***
## ouvriers 3.955e-02 1.324e-02 2.988 0.003899 **
## `tmoy.avril-2020` 3.270e-02 1.105e-02 2.960 0.004236 **
## `tmoy.mars-2020` -5.635e-02 1.401e-02 -4.022 0.000147 ***
## `hosp_pop.2020-04-05` 3.769e-01 1.097e-01 3.437 0.001008 **
## `hosp_pop.2020-04-07` -4.425e-01 1.299e-01 -3.407 0.001108 **
## `hosp_pop.2020-04-09` 1.744e-01 1.195e-01 1.459 0.149240
## `hosp_pop.2020-04-10` 3.439e-01 1.203e-01 2.858 0.005648 **
## `hosp_pop.2020-04-14` 7.713e-01 7.480e-02 10.311 1.54e-15 ***
## `rea_pop.2020-04-04` 2.101e-01 7.248e-02 2.898 0.005043 **
## `rea_pop.2020-04-05` -2.969e-01 7.910e-02 -3.754 0.000363 ***
## `rea_pop.2020-04-12` 2.866e-01 1.261e-01 2.272 0.026265 *
## `rea_pop.2020-04-13` -4.976e-01 1.336e-01 -3.725 0.000399 ***
## `hosp_pop.2020-04-06` -1.713e-01 1.426e-01 -1.201 0.234003
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.04736 on 68 degrees of freedom
## Multiple R-squared: 0.9984, Adjusted R-squared: 0.9978
## F-statistic: 1566 on 27 and 68 DF, p-value: < 2.2e-16
On remarque donc effectivement que ce modèle fonctionne très bien avec un R-squared très proche voire supérieur au modele contenant toutes les variables.
On peut donc en déduire une sélection de nos variables pour l’explication du nombre d’hospitalisations avec la regression linéaire.
Nous décidons d’effectuer également une selection de variable pour expliquer le nombre de reanimations.
##
## Call:
## lm(formula = data_for_regression$rea_pop ~ ., data = data_for_regression)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.12319 -0.03290 0.00309 0.02693 0.12631
##
## Coefficients: (1 not defined because of singularities)
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -2.828e-16 7.555e-03 0.000 1.00000
## hosp_pop 5.860e-01 1.841e-01 3.184 0.00267 **
## nbr_pop -2.306e-02 2.325e-02 -0.992 0.32666
## pourcentage_10_19ans -8.449e-02 5.473e-02 -1.544 0.12977
## pourcentage_20_39ans -4.510e-02 6.700e-02 -0.673 0.50438
## pourcentage_40_59ans 1.089e-02 2.009e-02 0.542 0.59036
## pourcentage_60_74ans -4.692e-02 9.430e-02 -0.498 0.62129
## pourcentage_75_etplus NA NA NA NA
## taux_pauvrete_moy 1.899e-01 4.276e-01 0.444 0.65920
## taux_pauvrete_30etmoins -4.664e-02 6.786e-02 -0.687 0.49552
## taux_pauvrete_30_39ans -1.047e-01 9.464e-02 -1.107 0.27441
## taux_pauvrete_40_49ans 7.712e-02 1.697e-01 0.454 0.65175
## taux_pauvrete_50_59ans -4.296e-02 1.010e-01 -0.425 0.67268
## taux_pauvrete_60_74ans -1.021e-01 1.227e-01 -0.832 0.40971
## taux_pauvrete_75etplus -3.038e-02 5.722e-02 -0.531 0.59815
## med_revenu -6.709e-02 5.791e-02 -1.159 0.25287
## pourcentage_menage_imposes 2.005e-02 4.514e-02 0.444 0.65904
## frequence_obesite -3.642e-03 1.683e-02 -0.216 0.82969
## agriculteurs -1.790e-01 3.074e-01 -0.582 0.56331
## artisans -1.660e-01 2.621e-01 -0.633 0.52973
## cadres -4.990e-01 1.007e+00 -0.496 0.62267
## prof_ind -1.728e-01 3.159e-01 -0.547 0.58704
## employes -2.437e-01 4.136e-01 -0.589 0.55866
## ouvriers -4.784e-01 8.099e-01 -0.591 0.55773
## autres -6.496e-03 8.376e-02 -0.078 0.93854
## `tmoy.avril-2020` -1.394e-02 2.257e-02 -0.617 0.54015
## `tmoy.mars-2020` 6.880e-03 3.293e-02 0.209 0.83547
## `hosp_pop.2020-04-02` 4.058e-03 2.261e-01 0.018 0.98576
## `hosp_pop.2020-04-03` -1.437e-01 3.289e-01 -0.437 0.66416
## `hosp_pop.2020-04-04` 9.934e-02 3.236e-01 0.307 0.76032
## `hosp_pop.2020-04-05` -4.849e-02 3.723e-01 -0.130 0.89698
## `hosp_pop.2020-04-06` -1.991e-01 2.656e-01 -0.750 0.45751
## `hosp_pop.2020-04-07` 7.574e-01 2.858e-01 2.650 0.01113 *
## `hosp_pop.2020-04-08` -5.871e-01 2.930e-01 -2.004 0.05126 .
## `hosp_pop.2020-04-09` 2.548e-01 3.120e-01 0.817 0.41846
## `hosp_pop.2020-04-10` -9.239e-02 3.238e-01 -0.285 0.77672
## `hosp_pop.2020-04-11` -2.728e-01 4.087e-01 -0.668 0.50790
## `hosp_pop.2020-04-12` 5.532e-01 5.585e-01 0.990 0.32740
## `hosp_pop.2020-04-13` -4.592e-01 5.634e-01 -0.815 0.41938
## `hosp_pop.2020-04-14` -4.346e-01 3.593e-01 -1.210 0.23288
## `rea_pop.2020-04-02` -3.332e-01 1.581e-01 -2.107 0.04086 *
## `rea_pop.2020-04-03` 3.421e-01 2.182e-01 1.568 0.12407
## `rea_pop.2020-04-04` -8.092e-02 2.265e-01 -0.357 0.72253
## `rea_pop.2020-04-05` -1.361e-02 2.249e-01 -0.061 0.95201
## `rea_pop.2020-04-06` 2.761e-01 2.397e-01 1.152 0.25560
## `rea_pop.2020-04-07` -2.523e-02 2.176e-01 -0.116 0.90821
## `rea_pop.2020-04-08` -3.171e-01 2.440e-01 -1.300 0.20052
## `rea_pop.2020-04-09` 1.773e-01 2.458e-01 0.721 0.47457
## `rea_pop.2020-04-10` -1.307e-01 1.558e-01 -0.839 0.40614
## `rea_pop.2020-04-11` -9.823e-02 2.633e-01 -0.373 0.71089
## `rea_pop.2020-04-12` -5.779e-02 3.405e-01 -0.170 0.86601
## `rea_pop.2020-04-13` 3.413e-01 3.998e-01 0.854 0.39796
## `rea_pop.2020-04-14` 8.676e-01 1.875e-01 4.628 3.26e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.07403 on 44 degrees of freedom
## Multiple R-squared: 0.9975, Adjusted R-squared: 0.9945
## F-statistic: 339.1 on 51 and 44 DF, p-value: < 2.2e-16
##
## Call:
## lm(formula = data_for_regression$rea_pop ~ hosp_pop + pourcentage_10_19ans +
## taux_pauvrete_moy + taux_pauvrete_30etmoins + taux_pauvrete_60_74ans +
## employes + ouvriers + `hosp_pop.2020-04-03` + `hosp_pop.2020-04-07` +
## `hosp_pop.2020-04-08` + `hosp_pop.2020-04-12` + `hosp_pop.2020-04-14` +
## `rea_pop.2020-04-02` + `rea_pop.2020-04-03` + `rea_pop.2020-04-06` +
## `rea_pop.2020-04-10` + `rea_pop.2020-04-14` + `hosp_pop.2020-04-13` +
## autres, data = data_for_regression)
##
## Coefficients:
## (Intercept) hosp_pop pourcentage_10_19ans
## -2.905e-16 4.444e-01 -2.909e-02
## taux_pauvrete_moy taux_pauvrete_30etmoins taux_pauvrete_60_74ans
## 1.355e-01 -5.030e-02 -1.022e-01
## employes ouvriers `hosp_pop.2020-04-03`
## -2.517e-02 -3.040e-02 -1.974e-01
## `hosp_pop.2020-04-07` `hosp_pop.2020-04-08` `hosp_pop.2020-04-12`
## 5.736e-01 -4.177e-01 4.016e-01
## `hosp_pop.2020-04-14` `rea_pop.2020-04-02` `rea_pop.2020-04-03`
## -3.035e-01 -2.729e-01 2.081e-01
## `rea_pop.2020-04-06` `rea_pop.2020-04-10` `rea_pop.2020-04-14`
## 1.216e-01 -1.426e-01 1.030e+00
## `hosp_pop.2020-04-13` autres
## -4.693e-01 3.191e-02
##
## Call:
## lm(formula = data_for_regression$rea_pop ~ hosp_pop + pourcentage_10_19ans +
## taux_pauvrete_moy + taux_pauvrete_30etmoins + taux_pauvrete_60_74ans +
## employes + ouvriers + `hosp_pop.2020-04-03` + `hosp_pop.2020-04-07` +
## `hosp_pop.2020-04-08` + `hosp_pop.2020-04-12` + `hosp_pop.2020-04-14` +
## `rea_pop.2020-04-02` + `rea_pop.2020-04-03` + `rea_pop.2020-04-06` +
## `rea_pop.2020-04-10` + `rea_pop.2020-04-14` + `hosp_pop.2020-04-13` +
## autres, data = data_for_regression)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.151714 -0.032641 -0.000041 0.035764 0.166029
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -2.905e-16 6.436e-03 0.000 1.000000
## hosp_pop 4.444e-01 1.154e-01 3.850 0.000244 ***
## pourcentage_10_19ans -2.909e-02 1.195e-02 -2.434 0.017298 *
## taux_pauvrete_moy 1.355e-01 5.867e-02 2.309 0.023653 *
## taux_pauvrete_30etmoins -5.030e-02 2.633e-02 -1.910 0.059858 .
## taux_pauvrete_60_74ans -1.022e-01 4.177e-02 -2.448 0.016688 *
## employes -2.517e-02 1.013e-02 -2.484 0.015194 *
## ouvriers -3.040e-02 1.088e-02 -2.795 0.006572 **
## `hosp_pop.2020-04-03` -1.974e-01 7.701e-02 -2.564 0.012330 *
## `hosp_pop.2020-04-07` 5.736e-01 1.537e-01 3.732 0.000365 ***
## `hosp_pop.2020-04-08` -4.177e-01 1.513e-01 -2.762 0.007209 **
## `hosp_pop.2020-04-12` 4.016e-01 2.753e-01 1.459 0.148742
## `hosp_pop.2020-04-14` -3.035e-01 2.329e-01 -1.303 0.196420
## `rea_pop.2020-04-02` -2.729e-01 8.821e-02 -3.094 0.002763 **
## `rea_pop.2020-04-03` 2.081e-01 8.860e-02 2.349 0.021413 *
## `rea_pop.2020-04-06` 1.216e-01 7.299e-02 1.667 0.099729 .
## `rea_pop.2020-04-10` -1.426e-01 7.234e-02 -1.971 0.052311 .
## `rea_pop.2020-04-14` 1.030e+00 6.637e-02 15.516 < 2e-16 ***
## `hosp_pop.2020-04-13` -4.693e-01 3.015e-01 -1.556 0.123785
## autres 3.191e-02 1.952e-02 1.635 0.106236
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.06306 on 76 degrees of freedom
## Multiple R-squared: 0.9968, Adjusted R-squared: 0.996
## F-statistic: 1253 on 19 and 76 DF, p-value: < 2.2e-16
On remarque donc effectivement que ce modèle aussi fonctionne très bien avec un R-squared très proche voire supérieur au modele contenant toutes les variables.
Plus particulièrement, le nombre d’hospitalisations 8 jours avant le nombre de reanimations du 15/04 impact plus le modèle que les autres variables.
Nous utilisons maintenant à la ridge regression.
On commence d’abord par observer les coefficients de nos variables en fonction des log lambdas:
On selectionne maintenant le lambda optimal:
## [1] 0.006309573
On observe les coefficients de chaque variable avec ce lambda.
Plus un coefficient est éloignée de 0 et plus il a un impact sur le modèle.
## 52 x 1 sparse Matrix of class "dgCMatrix"
## s0
## rea_pop 0.121033633
## nbr_pop 0.030133082
## pourcentage_10_19ans 0.015423194
## pourcentage_20_39ans -0.001381683
## pourcentage_40_59ans -0.022518068
## pourcentage_60_74ans -0.001928825
## pourcentage_75_etplus 0.002907253
## taux_pauvrete_moy -0.022643197
## taux_pauvrete_30etmoins 0.031867242
## taux_pauvrete_30_39ans 0.008832479
## taux_pauvrete_40_49ans -0.070884513
## taux_pauvrete_50_59ans -0.017173892
## taux_pauvrete_60_74ans 0.117391005
## taux_pauvrete_75etplus -0.012270172
## med_revenu 0.063934453
## pourcentage_menage_imposes -0.022484321
## frequence_obesite 0.024037809
## agriculteurs 0.004439358
## artisans 0.015912946
## cadres -0.030124529
## prof_ind 0.015439068
## employes 0.022732076
## ouvriers 0.017703857
## autres -0.029943367
## tmoy.avril-2020 0.018990386
## tmoy.mars-2020 -0.022567537
## hosp_pop.2020-04-02 0.042504301
## hosp_pop.2020-04-03 0.001450449
## hosp_pop.2020-04-04 0.017253463
## hosp_pop.2020-04-05 0.018751148
## hosp_pop.2020-04-06 -0.067218097
## hosp_pop.2020-04-07 -0.061165707
## hosp_pop.2020-04-08 -0.017562569
## hosp_pop.2020-04-09 0.080162251
## hosp_pop.2020-04-10 0.114979778
## hosp_pop.2020-04-11 0.152245018
## hosp_pop.2020-04-12 0.219808628
## hosp_pop.2020-04-13 0.240162680
## hosp_pop.2020-04-14 0.308294973
## rea_pop.2020-04-02 -0.064750234
## rea_pop.2020-04-03 -0.013057670
## rea_pop.2020-04-04 0.044969154
## rea_pop.2020-04-05 -0.032182189
## rea_pop.2020-04-06 -0.043288801
## rea_pop.2020-04-07 -0.033517790
## rea_pop.2020-04-08 0.009607015
## rea_pop.2020-04-09 0.014518854
## rea_pop.2020-04-10 0.011052416
## rea_pop.2020-04-11 -0.023360355
## rea_pop.2020-04-12 -0.003439202
## rea_pop.2020-04-13 -0.039599963
## rea_pop.2020-04-14 -0.007517508
Prediction Train :
## RMSE Rsquare
## 1 0.04596784 0.99818
Prediction Test :
## RMSE Rsquare
## 1 0.07409631 0.9899902
On remarque que les résultats de la prédiction sont bons. On arrive donc à prédire le pic d’hospitalisation du premier confinement par les variables que nous avons sélectionnés.
On commence d’abord par observer les coefficients de nos variables en fonction des log lambdas:
On selectionne maintenant le lambda optimal:
## [1] 0.001
On obtient un lambda optimal. On peut l’observer sur le graphique avec log(0.001) = -3.
Les coefficients de chaque variable sont étudiés avec ce lambda.
Plus un coefficient est éloignée de 0 et plus il a un impact sur le modèle.
## 52 x 1 sparse Matrix of class "dgCMatrix"
## s0
## hosp_pop 0.3955991975
## nbr_pop -0.0155262795
## pourcentage_10_19ans -0.0546626287
## pourcentage_20_39ans 0.0309412284
## pourcentage_40_59ans 0.0182988458
## pourcentage_60_74ans -0.0016571160
## pourcentage_75_etplus 0.0038882584
## taux_pauvrete_moy 0.0442331143
## taux_pauvrete_30etmoins -0.0315792093
## taux_pauvrete_30_39ans -0.0587216890
## taux_pauvrete_40_49ans 0.0869636264
## taux_pauvrete_50_59ans -0.0137030567
## taux_pauvrete_60_74ans -0.0520902728
## taux_pauvrete_75etplus -0.0199551054
## med_revenu -0.0758741207
## pourcentage_menage_imposes 0.0180122077
## frequence_obesite -0.0053000742
## agriculteurs -0.0129950963
## artisans -0.0240172023
## cadres 0.0240022369
## prof_ind -0.0067368978
## employes -0.0207379070
## ouvriers -0.0396058372
## autres 0.0293176655
## tmoy.avril-2020 -0.0059944454
## tmoy.mars-2020 -0.0060714604
## hosp_pop.2020-04-02 -0.1018970585
## hosp_pop.2020-04-03 -0.0362608059
## hosp_pop.2020-04-04 0.0762068109
## hosp_pop.2020-04-05 -0.0639363539
## hosp_pop.2020-04-06 -0.0077611605
## hosp_pop.2020-04-07 0.3336752899
## hosp_pop.2020-04-08 -0.0210977046
## hosp_pop.2020-04-09 -0.0251073252
## hosp_pop.2020-04-10 -0.1143749221
## hosp_pop.2020-04-11 -0.2115905726
## hosp_pop.2020-04-12 -0.0350413265
## hosp_pop.2020-04-13 -0.1536118741
## hosp_pop.2020-04-14 0.0112334830
## rea_pop.2020-04-02 -0.2792596428
## rea_pop.2020-04-03 0.1847324388
## rea_pop.2020-04-04 0.0808430529
## rea_pop.2020-04-05 -0.0347922345
## rea_pop.2020-04-06 0.2066056352
## rea_pop.2020-04-07 -0.0347519093
## rea_pop.2020-04-08 -0.1089814095
## rea_pop.2020-04-09 -0.0001414014
## rea_pop.2020-04-10 -0.1433267977
## rea_pop.2020-04-11 -0.0382798261
## rea_pop.2020-04-12 0.1533116176
## rea_pop.2020-04-13 0.2063170303
## rea_pop.2020-04-14 0.7167925201
Prediction Train :
## RMSE Rsquare
## 1 0.04359335 0.9983741
Prediction Test :
## RMSE Rsquare
## 1 0.1277363 0.9692566
Nous affichons le lambda optimal pour cette regression et nous observons les coefficients associés aux variables:
## [1] 0.001584893
## 52 x 1 sparse Matrix of class "dgCMatrix"
## s0
## rea_pop 3.671080e-05
## nbr_pop 1.047853e-02
## pourcentage_10_19ans .
## pourcentage_20_39ans 2.021677e-02
## pourcentage_40_59ans .
## pourcentage_60_74ans .
## pourcentage_75_etplus .
## taux_pauvrete_moy .
## taux_pauvrete_30etmoins .
## taux_pauvrete_30_39ans .
## taux_pauvrete_40_49ans .
## taux_pauvrete_50_59ans .
## taux_pauvrete_60_74ans 1.470894e-02
## taux_pauvrete_75etplus .
## med_revenu 1.730967e-02
## pourcentage_menage_imposes .
## frequence_obesite 1.061412e-02
## agriculteurs .
## artisans .
## cadres .
## prof_ind .
## employes 1.355589e-02
## ouvriers .
## autres -1.503521e-02
## tmoy.avril-2020 .
## tmoy.mars-2020 -3.202288e-03
## hosp_pop.2020-04-02 .
## hosp_pop.2020-04-03 .
## hosp_pop.2020-04-04 .
## hosp_pop.2020-04-05 .
## hosp_pop.2020-04-06 .
## hosp_pop.2020-04-07 .
## hosp_pop.2020-04-08 .
## hosp_pop.2020-04-09 .
## hosp_pop.2020-04-10 2.317168e-02
## hosp_pop.2020-04-11 9.786691e-06
## hosp_pop.2020-04-12 1.100678e-01
## hosp_pop.2020-04-13 .
## hosp_pop.2020-04-14 8.955505e-01
## rea_pop.2020-04-02 -5.577486e-02
## rea_pop.2020-04-03 .
## rea_pop.2020-04-04 .
## rea_pop.2020-04-05 .
## rea_pop.2020-04-06 .
## rea_pop.2020-04-07 .
## rea_pop.2020-04-08 .
## rea_pop.2020-04-09 .
## rea_pop.2020-04-10 .
## rea_pop.2020-04-11 .
## rea_pop.2020-04-12 .
## rea_pop.2020-04-13 .
## rea_pop.2020-04-14 .
Prediction Train :
## RMSE Rsquare
## 1 0.05933304 0.9969678
Prediction Test :
## RMSE Rsquare
## 1 0.06474027 0.9923585
Nous affichons le lambda optimal pour cette regression et nous observons les coefficients associés aux variables:
## [1] 0.001
## 52 x 1 sparse Matrix of class "dgCMatrix"
## s0
## hosp_pop 0.058992341
## nbr_pop 0.002370476
## pourcentage_10_19ans -0.025623432
## pourcentage_20_39ans 0.029865845
## pourcentage_40_59ans -0.003733255
## pourcentage_60_74ans .
## pourcentage_75_etplus .
## taux_pauvrete_moy .
## taux_pauvrete_30etmoins -0.002664691
## taux_pauvrete_30_39ans .
## taux_pauvrete_40_49ans 0.011268914
## taux_pauvrete_50_59ans .
## taux_pauvrete_60_74ans .
## taux_pauvrete_75etplus .
## med_revenu .
## pourcentage_menage_imposes 0.002078577
## frequence_obesite 0.006413181
## agriculteurs -0.011525742
## artisans .
## cadres .
## prof_ind 0.003415706
## employes -0.009066834
## ouvriers -0.006069003
## autres 0.009286734
## tmoy.avril-2020 .
## tmoy.mars-2020 -0.008333194
## hosp_pop.2020-04-02 .
## hosp_pop.2020-04-03 .
## hosp_pop.2020-04-04 .
## hosp_pop.2020-04-05 .
## hosp_pop.2020-04-06 .
## hosp_pop.2020-04-07 0.003956741
## hosp_pop.2020-04-08 .
## hosp_pop.2020-04-09 .
## hosp_pop.2020-04-10 .
## hosp_pop.2020-04-11 .
## hosp_pop.2020-04-12 .
## hosp_pop.2020-04-13 .
## hosp_pop.2020-04-14 .
## rea_pop.2020-04-02 -0.193915933
## rea_pop.2020-04-03 0.007787617
## rea_pop.2020-04-04 0.110787110
## rea_pop.2020-04-05 .
## rea_pop.2020-04-06 0.041566784
## rea_pop.2020-04-07 .
## rea_pop.2020-04-08 .
## rea_pop.2020-04-09 .
## rea_pop.2020-04-10 .
## rea_pop.2020-04-11 .
## rea_pop.2020-04-12 .
## rea_pop.2020-04-13 .
## rea_pop.2020-04-14 0.934435600
Prediction Train :
## RMSE Rsquare
## 1 0.06028964 0.9968901
Prediction Test :
## RMSE Rsquare
## 1 0.101226 0.9806933
## 53 x 1 sparse Matrix of class "dgCMatrix"
## 1
## (Intercept) -1.818023e-03
## rea_pop .
## nbr_pop 3.379315e-05
## pourcentage_10_19ans .
## pourcentage_20_39ans .
## pourcentage_40_59ans .
## pourcentage_60_74ans .
## pourcentage_75_etplus .
## taux_pauvrete_moy .
## taux_pauvrete_30etmoins .
## taux_pauvrete_30_39ans .
## taux_pauvrete_40_49ans .
## taux_pauvrete_50_59ans .
## taux_pauvrete_60_74ans .
## taux_pauvrete_75etplus .
## med_revenu .
## pourcentage_menage_imposes 1.635795e-02
## frequence_obesite .
## agriculteurs .
## artisans .
## cadres .
## prof_ind .
## employes .
## ouvriers .
## autres .
## tmoy.avril-2020 .
## tmoy.mars-2020 .
## hosp_pop.2020-04-02 .
## hosp_pop.2020-04-03 .
## hosp_pop.2020-04-04 .
## hosp_pop.2020-04-05 .
## hosp_pop.2020-04-06 .
## hosp_pop.2020-04-07 .
## hosp_pop.2020-04-08 .
## hosp_pop.2020-04-09 .
## hosp_pop.2020-04-10 .
## hosp_pop.2020-04-11 .
## hosp_pop.2020-04-12 1.819194e-01
## hosp_pop.2020-04-13 .
## hosp_pop.2020-04-14 7.925011e-01
## rea_pop.2020-04-02 .
## rea_pop.2020-04-03 .
## rea_pop.2020-04-04 .
## rea_pop.2020-04-05 .
## rea_pop.2020-04-06 .
## rea_pop.2020-04-07 .
## rea_pop.2020-04-08 .
## rea_pop.2020-04-09 .
## rea_pop.2020-04-10 .
## rea_pop.2020-04-11 .
## rea_pop.2020-04-12 .
## rea_pop.2020-04-13 .
## rea_pop.2020-04-14 .
## RMSE Rsquare
## 1 0.07375633 0.9953143
## RMSE Rsquare
## 1 0.06150623 0.9931028
## 53 x 1 sparse Matrix of class "dgCMatrix"
## 1
## (Intercept) -0.006417782
## hosp_pop 0.048998529
## nbr_pop .
## pourcentage_10_19ans .
## pourcentage_20_39ans 0.017148006
## pourcentage_40_59ans -0.022843425
## pourcentage_60_74ans .
## pourcentage_75_etplus .
## taux_pauvrete_moy .
## taux_pauvrete_30etmoins .
## taux_pauvrete_30_39ans .
## taux_pauvrete_40_49ans .
## taux_pauvrete_50_59ans .
## taux_pauvrete_60_74ans 0.007603757
## taux_pauvrete_75etplus .
## med_revenu .
## pourcentage_menage_imposes .
## frequence_obesite 0.015301145
## agriculteurs .
## artisans .
## cadres 0.024848735
## prof_ind .
## employes .
## ouvriers .
## autres .
## tmoy.avril-2020 .
## tmoy.mars-2020 -0.004242468
## hosp_pop.2020-04-02 .
## hosp_pop.2020-04-03 .
## hosp_pop.2020-04-04 .
## hosp_pop.2020-04-05 .
## hosp_pop.2020-04-06 .
## hosp_pop.2020-04-07 .
## hosp_pop.2020-04-08 .
## hosp_pop.2020-04-09 .
## hosp_pop.2020-04-10 .
## hosp_pop.2020-04-11 .
## hosp_pop.2020-04-12 .
## hosp_pop.2020-04-13 .
## hosp_pop.2020-04-14 .
## rea_pop.2020-04-02 .
## rea_pop.2020-04-03 .
## rea_pop.2020-04-04 .
## rea_pop.2020-04-05 .
## rea_pop.2020-04-06 .
## rea_pop.2020-04-07 .
## rea_pop.2020-04-08 .
## rea_pop.2020-04-09 .
## rea_pop.2020-04-10 .
## rea_pop.2020-04-11 .
## rea_pop.2020-04-12 .
## rea_pop.2020-04-13 .
## rea_pop.2020-04-14 0.915233033
## RMSE Rsquare
## 1 0.0795024 0.9945922
## RMSE Rsquare
## 1 0.07756961 0.9886628
Avant de conclure sur la selection de variables explicatives, on remarque d’abord que les modèles que nous avons effectuées ont bien fonctionnés. Ce qui signifie que nos variables expliquent bien le nombre d’hospitalisations.
## RMSE train Rsquare Train RMSE test Rsquare test
## ridge 0.04596784 0.9981800 0.07409631 0.9899902
## lasso 0.05933304 0.9969678 0.06474027 0.9923585
## Reg lineaire 0.01975679 0.9979222 0.13135182 0.9979222
## Elastic net 0.07375633 0.9953143 0.06150623 0.9931028
La régression ridge nous permet d’estimer les coefficients de la regression linéaire en prenant pour Y le nombre d’hospitalisation du pic du covid en avril 2020. Nous rappelons que plus un coefficient est faible et moins il est utile dans notre prédiction.
C’est pourquoi nous avons décider de sélectionner les variables dont le coefficient est supérieur à 0.01.
## coef
## rea_pop 0.12103363
## taux_pauvrete_40_49ans -0.07088451
## taux_pauvrete_60_74ans 0.11739100
## med_revenu 0.06393445
## hosp_pop.2020-04-06 -0.06721810
## hosp_pop.2020-04-07 -0.06116571
## hosp_pop.2020-04-09 0.08016225
## hosp_pop.2020-04-10 0.11497978
## hosp_pop.2020-04-11 0.15224502
## hosp_pop.2020-04-12 0.21980863
## hosp_pop.2020-04-13 0.24016268
## hosp_pop.2020-04-14 0.30829497
## rea_pop.2020-04-02 -0.06475023
## coef
## rea_pop 3.671080e-05
## nbr_pop 1.047853e-02
## pourcentage_20_39ans 2.021677e-02
## taux_pauvrete_60_74ans 1.470894e-02
## med_revenu 1.730967e-02
## frequence_obesite 1.061412e-02
## employes 1.355589e-02
## autres -1.503521e-02
## tmoy.mars-2020 -3.202288e-03
## hosp_pop.2020-04-10 2.317168e-02
## hosp_pop.2020-04-11 9.786691e-06
## hosp_pop.2020-04-12 1.100678e-01
## hosp_pop.2020-04-14 8.955505e-01
## rea_pop.2020-04-02 -5.577486e-02
## coef
## (Intercept) -1.818023e-03
## nbr_pop 3.379315e-05
## pourcentage_menage_imposes 1.635795e-02
## hosp_pop.2020-04-12 1.819194e-01
## hosp_pop.2020-04-14 7.925011e-01
De même pour la réanimation du pic du covid, les modèles que nous avons effectués ont bien fonctionnés. Ce qui signifie que nos variables expliquent bien le nombre de reanimations.
## RMSE train Rsquare Train RMSE test Rsquare test
## ridge 0.04359335 0.9983741 0.12773628 0.9692566
## lasso 0.06028964 0.9968901 0.10122599 0.9806933
## Reg lineaire 0.03320918 0.9932535 0.20646583 0.9932535
## elastic net 0.07950240 0.9945922 0.07756961 0.9886628
La régression ridge nous permet d’estimer les coefficients de la regression linéaire en prenant pour Y le nombre de réanimations du pic du covid en avril 2020. Nous rappelons que plus un coefficient est faible et moins il est utile dans notre prédiction.
C’est pourquoi nous avons décider de sélectionner les variables dont le coefficient est supérieur à 0.05.
## coef
## hosp_pop 0.39559920
## pourcentage_10_19ans -0.05466263
## taux_pauvrete_30_39ans -0.05872169
## taux_pauvrete_40_49ans 0.08696363
## taux_pauvrete_60_74ans -0.05209027
## med_revenu -0.07587412
## hosp_pop.2020-04-02 -0.10189706
## hosp_pop.2020-04-04 0.07620681
## hosp_pop.2020-04-05 -0.06393635
## hosp_pop.2020-04-07 0.33367529
## hosp_pop.2020-04-10 -0.11437492
## hosp_pop.2020-04-11 -0.21159057
## hosp_pop.2020-04-13 -0.15361187
## rea_pop.2020-04-02 -0.27925964
## rea_pop.2020-04-03 0.18473244
## rea_pop.2020-04-04 0.08084305
## rea_pop.2020-04-06 0.20660564
## rea_pop.2020-04-08 -0.10898141
## rea_pop.2020-04-10 -0.14332680
## rea_pop.2020-04-12 0.15331162
## rea_pop.2020-04-13 0.20631703
## rea_pop.2020-04-14 0.71679252
## coef
## rea_pop 3.671080e-05
## nbr_pop 1.047853e-02
## pourcentage_20_39ans 2.021677e-02
## taux_pauvrete_60_74ans 1.470894e-02
## med_revenu 1.730967e-02
## frequence_obesite 1.061412e-02
## employes 1.355589e-02
## autres -1.503521e-02
## tmoy.mars-2020 -3.202288e-03
## hosp_pop.2020-04-10 2.317168e-02
## hosp_pop.2020-04-11 9.786691e-06
## hosp_pop.2020-04-12 1.100678e-01
## hosp_pop.2020-04-14 8.955505e-01
## rea_pop.2020-04-02 -5.577486e-02
## coef
## (Intercept) -0.006417782
## hosp_pop 0.048998529
## pourcentage_20_39ans 0.017148006
## pourcentage_40_59ans -0.022843425
## taux_pauvrete_60_74ans 0.007603757
## frequence_obesite 0.015301145
## cadres 0.024848735
## tmoy.mars-2020 -0.004242468
## rea_pop.2020-04-14 0.915233033